智能论文笔记

深度卷积神经网络（CNN）最近已达到最先进的手写文本识别（HTR）性能。但是，最近的研究表明，典型的CNN的学习性能是有限的，因为它们是具有简单（线性）神经元模型的同质网络。由于它们的异质网络结构结合了非线性神经元，最近提出了操作神经网络（ONNS）来解决这一缺点。自我结合是具有生成神经元模型的ONN的自组织变化，可以使用泰勒近似来生成任何非线性函数。在这项研究中，为了提高HTR的最新性能水平，提出了新型网络模型核心中的2D自组织（自我强调）。此外，本研究中使用了可变形的卷积，最近被证明可以更好地解决写作风格的变化。 IAM英语数据集和Hadara80p阿拉伯数据集中的结果表明，具有自我影响的操作层的拟议模型显着提高了字符错误率（CER）和单词错误率（WER）。与同行CNN相比，Hadara80p中的自我强调将CER和3.4％降低，在IAM数据集中，自我强调将CER降低1.2％和3.4％，为0.199％和1.244％。基准IAM上的结果表明，与自相互紧缩的操作层的拟议模型通过显着的边缘优于最近的深CNN模型，而使用具有可变形卷积的自我冲突表明了出色的结果。

translated by 谷歌翻译

众所周知，学习障碍主要干扰阅读，写作和数学等基本学习技能，会影响世界上约10％的儿童。作为神经发育障碍的一部分的运动技能和运动协调不足可能成为学习写作困难（障碍）的原因因素，从而阻碍了个人的学术轨道。障碍症的体征和症状包括但不限于不规则的笔迹，不正确的写作媒介处理，缓慢或劳力的写作，不寻常的手部位等。所有类型的学习障碍的评估标准是由医学医学进行的检查专家。少数可用的人工智能筛查系统用于障碍症，依赖于相应图像中手写的独特特征。这项工作对文献中儿童的现有自动化障碍诊断系统进行了综述。这项工作的主要重点是审查基于人工智能的儿童诊断的基于人工智能的系统。这项工作讨论了数据收集方法，重要的手写功能，用于诊断障碍症的文献中使用的机器学习算法。除此之外，本文还讨论了一些基于非人工智能的自动化系统。此外，本文讨论了现有系统的缺点，并提出了一个新颖的障碍诊断框架。

translated by 谷歌翻译

Backbones-Review: Feature Extraction Networks for Deep Learning and Deep Reinforcement Learning Approaches

Omar Elharroussad , Younes Akbari , Noor Almaadeed , Somaya Al-Maadeed

分类：计算机视觉

2022-06-16

为了使用各种类型的数据理解现实世界，人工智能（AI）是当今最常用的技术。在分析数据中找到模式的同时表示主要任务。这是通过提取代表性特征步骤来执行的，该步骤是使用统计算法或使用某些特定过滤器进行的。但是，从大规模数据中选择有用的功能代表了至关重要的挑战。现在，随着卷积神经网络（CNN）的发展，功能提取操作变得更加自动和更容易。 CNN允许处理大规模的数据，并涵盖特定任务的不同方案。对于计算机视觉任务，卷积网络也用于为深度学习模型的其他部分提取功能。选择合适的网络用于特征提取或DL模型的其他部分不是随机工作。因此，这种模型的实现可能与目标任务以及其计算复杂性有关。已经提出了许多网络，并成为任何AI任务中任何DL模型的著名网络。这些网络被利用用于特征提取或在任何名为骨架的DL模型的开头。骨干是以前在许多其他任务中训练并证明其有效性的已知网络。在本文中，现有骨干的概述，例如详细说明给出了VGG，Resnets，Densenet等。此外，通过对所使用的骨干进行审查，讨论了几个计算机视觉任务。此外，还基于每个任务的骨干，还提供了性能的比较。

translated by 谷歌翻译

视频分析的图像分割在不同的研究领域起着重要作用，例如智能城市，医疗保健，计算机视觉和地球科学以及遥感应用。在这方面，最近致力于发展新的细分策略;最新的杰出成就之一是Panoptic细分。后者是由语义和实例分割的融合引起的。明确地，目前正在研究Panoptic细分，以帮助获得更多对视频监控，人群计数，自主驾驶，医学图像分析的图像场景的更细致的知识，以及一般对场景更深入的了解。为此，我们介绍了本文的首次全面审查现有的Panoptic分段方法，以获得作者的知识。因此，基于所采用的算法，应用场景和主要目标的性质，执行现有的Panoptic技术的明确定义分类。此外，讨论了使用伪标签注释新数据集的Panoptic分割。继续前进，进行消融研究，以了解不同观点的Panoptic方法。此外，讨论了适合于Panoptic分割的评估度量，并提供了现有解决方案性能的比较，以告知最先进的并识别其局限性和优势。最后，目前对主题技术面临的挑战和吸引不久的将来吸引相当兴趣的未来趋势，可以成为即将到来的研究研究的起点。提供代码的文件可用于：https：//github.com/elharroussomar/awesome-panoptic-egation

translated by 谷歌翻译